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Uma das maneiras de alhar o oficia de produzir 
informações sociais, econômicas e territoriais é como orte de 
descrever o mundo. Estatísticas e mapas transportam os fenômenos 
da realidade para escalas apropriadas à perspectiva de nossa visão 
humana e nos permitem pensar e agir ò distancia, construindo 
avenidas de mão dupla que juntam o mundo e suas imagens. Maior o 
poder de síntese dessas representações, combinando, com precisão, 
elementos dispersos e heterogêneos do cotidiano, maior o nosso 
conhecimento e o nossa capacidade de compreender e transformar o 
realidade. 

Visto como arte, o ofício de produzir essas informações 
reflete a cultura de um País e de sua época, como essa cultura vê o 
mundo e o forna visível, redefinindo o que vê e o que hd para se ver. 

No cenário de contínua inovação tecnológica e mudança 
de culturas da sociedade contemporânea, as novas tecnologias de 
informação - reunindo computadores, telecomunicações e redes de 
informação - aceleram aquele movimento de mobilização do mundo 
real. Aumenta a velocidade da acumulação de informação e são 
ampliados seus requisitos de atualização, formato - mais flexível, 
personalizado e interativo - e, principalmente, de acessibilidade. A 
plataforma digital vem se consolidando como o meio mais simples, 
barato e poderoso paro tratar a informação, tornando possíveis 
novos produtes e serviços e conquistando novos usuários. 

Acreditamos ser o ambiente de conversa e controvérsia 
e de troca entre as diferentes disciplinas, nas mesas redondas e 
sessões temáticas das Conferências Nacionais de Ceografla, 
Cartografa e Estatística e do Címpásio de Inovações, aquele que 
melhor enseja o aprimoramento do consenso sobre os fenômenos a 
serem mensurados para retratar a sociedade, a economia e o 
Território nacional e sobre as prioridades e formatos das informações 
necessárias para o fortalecimento da cidadania, a definição de 
políticas públicas e a gestão político - administrativa do País, e para 
criar uma sociedade mais Justa. 
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EDI - INTERCÂMBIO ELETRÔNICO DE DADOS PARA COLETA E 
DISSEMINAÇÃO DE DADOS ESTATÍSTICOS 

WJJKeller, Slatistics Netherlands, Holanda 



RESUMO 

Neste trabalho apresoitaremos alguma»; experiêndas na Holanda com o EDI para a coleta e 
disseminação de dados estatísticos. Consideraremos as nmdanças a serem realizadas para a 
coleta de dados em larga escala em EDI. Discutiremos que o EDI «dge tun redesenho 
drástico da forma pela qual coletamos e processamos informações estatísticas, porém, os 
benefídos em termos de carga de resposta qualidade e efidênda valem a pena. 

Discutiremos também alguns projetos na Statistics Netiieriands tratando com o EDI para a 
disseminação estatística. Vamos apresentar o Statiine (nosso banco de dados estatísticos 
com uma ferramenta de consulta on Une para o diente remoto no DOS) e a sua nova v^são 
e?q)enmental com uma rede dinâmica na Internet. Vamos informar também que a Internet 
imo tqrenas propordona boas oportunidades como também grandes desafios para os 
estatísticos. 

Vamos focar além dos aspectos teoiológtcos as impficações concdtuais e organizadonais 
do EDI para coleta e disseminação de dados. 

Palavras chave: estatística ofidal, coleta de dados, disseminação, EDI, Internet, Meta 
informação. 

1, ESTATÍSTICA OFICIAL 

Os Institutos Nadonais de Estatística (NSI) estão diante de várias questões estratégicas 
resultantes das novas danandas apresentadas pdos nossos dientes bem como por novos 
desenvolvimentos na informática. A efidênda e orienta^ para o mercado são as palavras 
chave de hoje. Predsamos produ 2 ãr a custos mais babtos. Alàn disso predsamos redutãr os 
custos que aplicamos aos nossos firmecedores de dados. O resultado deverá ser um 
produto que, embora não reahneote vendido num canqro de mercado, os nossos dientes 
possam eventualmente querer. Além disso, estamos diante de novos desenvolvimentos na 
informática. Esses desenvolvimentos nos darão as oportunidades para cons truir mos os 
instrumentos necessários para atendermos as novas demandas. Numa àtuação como essa 
um NSI predsa tomar uma dedsão estrat^ca correta. 

O processo de produto de estatísticas, é infiuendado pela demanda crescente dos nossos 
dientes (produ^) e dos nossos respondentes Qnsumo). Com relação à nossa produção 
vemos uma demanda para um melhor acesso, preferivelmente detrônico, soido mais 
amistoso ao usuário. Um aspecto particular é a demanda para o melhoramento da coerôida 
da totalidade das informações que oferecemos. W.r.t., nosso insumo, há uma forte demanda 
política por mna redução da carga do respondeote como uma parte de se aliviar a despesa 
administrativa das onpresas. NSIs como a Statistics Netherlands envia um milhão de 
questionários às empresas e outras instituições por ano. Empresas de grande e médio porte 
podem recdier até 50 qu^tionáiios por ano inclusive pesquisas repetitivas m^isais e 




trimestrais. A conclusão é clara: os NSIs predsam lutar contra os encargos burocráticos 
de preencha foiniuláiios. Alán disso os orçamentos estão^ sendo encolhidos, portanto há 
uma dCTianda por maior efidãida e maior produtividade. 

2. INFORMÁTICA 

Nós nos ben^damos com os novos desenvolvimentos da informática- o ímpeto da 
teoiología. Esses desenvolvim^os nos dão novas posdtnlidades técnicas, os mdos de 
constru^ de novos instrumentos para o nosso processo produdvo. Percdremos grandes 
aperfeiçoamentos nas posdbihdades de proc^samento de dados, aimaz^agem de dados e 
tranmnssão de dados, o úhimo a^recto provavdmente terá a maior das inâuôidas sobre 
nosso trabalho: o EDI - Intercânítno Eletrônico de Dados entre os nosso respondentes e o 
Instituto Estatístico por um lado e o EDI e o NSI e sois dioites por outro lado. 

Porém esses novos desenvolvimentos da infonnádca tambón oiam a sua própria demanda 
fora do NSL A nova teoiolo^ será usada em todos os higares. Nossos fornecedores de 
dados a utíHzaião. Nossos clioites a utílízarâo. Não mais ficarão satisf^os em se 
ccmninicar conosco da maneira antiga, ou sga, no ps^id. Nossos fornecedores produzem 
seus dados por mdos detrônicos e vão querer usar esses mdos para entregar esses dados 
diietamente a nós para mtnmrizar sois próprios custos. Nossos dientes processam nossos 
dados através de mdos detrônicos. Hes vão esd^ a crqraddade de sdedonar e recdier os 
dados com os instrumentos que a informática a ofdecer. 

Estes âtores levam à condu^ de que o NSI texk que tomar decisões estrat^cas em s^ 
processo de produ^ que foçam a mdhor urilÍ7gição posávd das possfoãidades que a 
informática teoha a oforeca-. O potendal da informática vai afetar todos os aspectos do 
nosso processo produtivo. Para desoevê-Ios predsamos discernir dentro do processo de 
produção, três eâá^os. A fose do insumo é quando os dados são coletados no contato 
com os re^ondentes. Na fose do processamaito esses dados são processados para 
produção deis informações com as características que buscamos. Na fose da produção essas 
informações »o oforeddas e disseminadas CTtre os nossos cÜCTtes. Nesse trabalho vamos 
nos concentrar sobre os efôtos externos, portanto, sobre a fose do insumo e produto. 

Visto que a fose da produ^ defii» o nosso produto e se rdadona com os nossos dientes 
vamos conãderá-la em piimeÍTO higar. Aqui o novos desenvolvimentos provaveiniente 
recd>em a maior atenção do público. Percd>anos as novas mídias pdas quais as 
informações podem ser apresentadas aos seus usuários. As publicações em papel podem 
continuar a ter o soi higar, porém e^iedalmente o usuário mais profisãonal vai querer 
seledonar e receber seus dados por mdos eletrôincos. Os NSIs estão produdndo ou 
desenvolvoido estes mdos: dados mn CD-ROM, dados na Lrtemet. Mais inqiortante e 
talvez mais (fifidl é a forma pela qual os dados devoão ser apresentados nessas novas 
mídias. O total das informações será muito maior do que tínhamos antigamente em 
publicações de papd. Nesse ponto a gestão da metainformação toma-se crítica. 

Para essa finalidade os NSIs estão desenvolvendo bancos de dados estatísticos, projetados 
para os usuários finais, propordonando acesso a todos os nossos dados. Conforme seria 
de se esperar, a estruturação desses dados r^esenta o problema principal. Ao mesmo 
tenqio, defrontamo-nos com a ausênda de coerdida ctevida também à ausênda da 




coordenação estatística. Os bancos de dados dos produtos são projetados para 
desempenharem um papel preponderante no processo de disseminação dos nossos dados. 
No futuro devemos optar pela alternativa estrat^ca de uma estrutura pela qual todas as 
publicações e todas as disseminações de dados passem pelo banco de dados. A Seção 3 vai 
apresentar as estraté^as de produtos com maior detalhe. 

Além do lado da produção, espedalm^ite a coleta de dados será reordoiada. Além da 
utilização do CAI - Entrevista Auxiliada por Computador, para as pesquisas domidliares, o 
EDI também desempenhará um papél preponderante nesse caso, espedalmente nas 
pesquisas de estabelecimentos . Devido à natur^a do EDI, não s^ mais a demanda pela 
informação (ou sga, cada pesquisa estatística), porán a oferta da informado dos nossos 
respondentes que ditará a organização a ser adotai E visto que a maioria das informações 
dos nossos respondentes indiretamente advêm de fontes de dados eletrônicos como por 
exemplo, sistonas contábds e r^jstros, deverraios nos concentrar nessas fontes. Se 
possível cada fonte deve sct derivada eletronicamente ^>enas uma vez e completamente, 
usando o HDI, para qualquer possível utilização dratro do NSL O acervo será téoiica e 
concdltualm^e aàaptaào a esta fonte. Na Seção 7 abaixo vamos desenvolva esse ponto 
de vista. 

Nesse trabalho focamos o EDI no lado do insumo produto do processo estatístico, vamos 
começar pdo lado do produto. 

3. DISSEMINAÇÃO 

Atualmrate a maioria dos ór^os estatísticos propordonam informações estatístícas 
agr^adas de várias formas, pordn, predominantonente de forma impressa (no papel). 
Visto que a impressão é uma forma relatívamente cara e pouco prática de disseminação, 
um número cada vez maior de pessoas busca a rodovia eletrônica (também conhecida como 
Intemet) como uma forma barata e âdl de disseminar informações estatísticas. Esse 
trabalho foca o impacto dessa tradênda sobre a estatística ofidal . Argumentaremos que, 
além da dimensão teaioló^ca de se publicar através da Internet, os prindpais problemas 
serão de natureza concdtual, ou seja, aqudes problemas atineotes à coordenado e 
interação estatística. 

Nesse trabalho discutiremos alguns projetos da Statistics Netherlands (SN) lidando com o 
]QOI para disseminação. Vamos âlar sobre o Statime (nosso banco de dados estatísticos 
como um instrum^o tradidonal de consulta an Une para o cliCTte remoto no DOS) e a sua 
nova versão experimental, Statlme-WnCH com páginas dinâmicas na Internet. Vamos 
informar que, através da combinado da &dlidade de utilizado com a Êidlidade de acesso 
da Internet com os dstemas de bancos de dados multidimenáonais encontrados na 
estatística, obter-se-ão grandes oportunidades para disseminado estatística. 

Atualmente nossas publicações tomam muitas configurações diferentes; papel impresso, 
disquetes fleáveis, &xes e CD-ROMS, resposta automática à voz humana, press-release, 
vídeo texto, etc. Além de todas essas mídias difer^es existem informações estatísticas 
agregadas, com fieqüênda de forma l^jvel pela máquina, ou sqa, como produto de 
sistemas de processamento de pesquisas. O que é necessário é um banco de dados de 
disseminado situado entre o tistema de processamento interno e o mundo «ctenor, capazes 




de prodii^ muitas mídias difeentes a partir de apenas uma fonte, de uma forma 
consistente, oportuna e efiàente. Além do acesso on lim. ao banco de dados, esse sist^na 
de bancos de dados também automaticamente proporcionaria informações para outras 
mídias, tais como disquetes, assinatura de correio eletrônico, Ê«es e publicações em CD- 
ROM . Porém o objetivo mais importante de tal sistema é propordonar um acesso on Une 
mais fòcil pelos nossos cüartes à riqueza de informações dos bureaus de estatística. A 
nossa opinião a esse respdto é que a Internet vai desempenhar um papel da maior 
importânda num iuturo muito próximo. 

Com a ascensão dos instrumentos de consulta gráfica (Mosaic, Netscape) na Internet, a 
rede cresceu im^isamente no último ano. Numa questão de meses quase toda empresa 
respdtáve! montou o asdm chamado “Servidor de Rede” na World Wde Web (WWW), 
A rede, com a sua popularidade em ascensão e portanto grande infira-estrutura, já está 
ãz^do a interligação de dezenas de milhões de pessoas no mundo intdro sendo que o 
acesso está ficando mais âdl com a largura de banda praticamente livre (na Holanda, a 
internet, com a veloddade de 28 Idbps, estará a uma chamada telefônica apenas de 
distância do mundo intdro ao final de 1995). Isso permite aos fôtatísúcos não apenas a 
coleta mais efidente de informações (vide nosso trabalho sobre o EDI), mas também 
disseminar estatísticas agr^adas com maior efídênda, com um custo marginal de 
reprodução e distribuição próximo de tsxo. (Já existem 27 núl asdnantes grátis do Top Ten 
Listserver do David Lettcnom: ima^nem esta drculação para press releasesl). 

AtualmCTte, vários institutos estatísticos publicam informações na rede através da WWW. 
Sravidores de rede bem conheddos como aqueles do US Census Bureau, Statistics Canada, 
Eurostat e SN para indicar alguns. Todos que têm uma ligação com a Internet e um 
instrumento de consulta como o Netscape pode visitar estes servidores do mundo inteiro. A 
maiotia do matoial publicado sobre essas redes, contudo, não são realmente informações 
estatísticas, porém listas de publicações, press releases, e informações gerais para o grande 
publico. A quantidade limitada de quantitativos verdadeiramente estatísticos com 
fi‘eqüênda é apresentada de forma documental ou seja, como cópias eletrônicas das 
páginas impressas de publicações tradidonais. 

Essa abordagem, que é tífuca para as assim chamadas “paginas estáticas da rede”, tornam 
difidl a manipuiação de quantitativos estatísticos como informações estruturadas, visto que 
o usuário ^>enas tem acesso aos documentos, ou sga, texto formatado. O que realmente é 
necessário é o acesso (através da Internet) a inn banco de dados real, englobando várias 
fontes estatísticas num ristema intocado. Uma vez que a nossa informação estatística 
esteja disponitnlizada de uma forma estruturada e acessável por máquina, podemos 
mampulá-la e q>resentá-la de qualquer forma, incluindo^uma forma não estruturada (como 
um documento em texto) e uma forma estruturada (como uma planilha). Essa abordagem 
do banco de dados estruturado é também necessária para ser possível proporcionar uma 
melhor coordenação e integração da informação estatística. 

Um exonplo de um banco de dados estatísticos é o Statline, da SN. Statline é baseado na 
arquitetura clioite/servidor enquanto que o usuário (rodando em micro, provavelmente 
fora da SN) está aâstado da área de processamento (o servidor do banco de dados, 
localizado na SN) . Tanto o usuário como o processamento estão atualmente conectados 
através de instalações tradicionais de comunicações de dados como Redes de Áreas Locais 




(LAN) intemamente ou através de linhas assíncronas (utilizando linhas telefônicas e 
modems) extemamente. Para otimizar o desempenho de seu banco de dados 
multidimensional (vide Seção 4), o Statline usa um projeto de data base proprietário não 
relacional baseado em arquivos indexados. O usuário baseado em DOS utiliza uma 
metáfora de desktop amistosa ao usuário com window e mouse onde os resultados das 
buscas são apresentadas num tipo de planilha multidimenãonal, com perspectivas gráficas 
adicionais, incluindo mapas temáticos. O front-end do Statline é o mesmo software que 
usamos como interfece das nossas publicações baseadas em disquetes (ou CD-ROM). 
Atualmente o Statline não usa a Internet mas isso mudará ao introduzirmos o conceito das 
“páginas dinâmicas da rede”. 

4. PÁGINAS DINÂMICAS DA REDE: A COMBINAÇÃO DA INTERNET 
COM BANCOS DE DADOS 

Conforme discutido adma, as informações estatísticas encontradas nas páginas normais da 
rede na Internet ^ (hficds de serem manipuladas de forma estruturada, diante do caráter 
documental (não numérico) da página da rede. Além disso, cada página da rede é estática 
em sua natureza, ou sga, predsamos preparar cada pá^na antedpadamente deSnindo sua 
imagem documental no servidor da rede. Não seria melhor combinarmos a potênda dos 

bancos de dados an line, como o nosso banco de dados Statline, com a &dlidade de 
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utilização e acesso à WWW? £ aqui que as asám chamadas “pá^nas dinâmicas da rede” 
entram na figura. A idda é usar hrawsers como o Netscape como front end de sistemas 
como o Statline. Sempre que o usuário soüdta dados, um int&face especial, chamado 
WnCH, traduz a soUdtação em formatos Statline e gera automaticamente uma página da 
rede para apresentar os resultados da Statline ao usuário. 

A seguir mostramos um exemplo de uma página de rede gerada pelo WITCH usando o 
Netscape 1 . 1 com um suporte de tabela HTML 3 . 






Utilizando um browser de rede como front-end de um banco de dados com informações 
estruturadas outros instrumentos de rede também tomam-se disponíveis. Por exemplo além 
da apresentação em formato de rede podemos também fezer o downloading de informações 
ou outros viewers no brcwser, ou sega, ver planilhas, gráficos ou mapas da rede. O 
WrrCH não vai apenas gerar páginas dinâmicas da rede, porém outros formatos como 
planilhas também. Desta forma o usuário pode salvar informações em formatos 
estruturados para manipular os dados mais tarde. 

As vantagens dessa abordagem são múltiplas: primeiramente, não precisamos construir a 
nossa ferramenta frara-end conforme nós fizemos no caso da Statline para o DOS. 
Qualquer usuário com um browser de rede decente, poderá acessar a Statline em qualquer 
lugar do mimdo. Segundo, através da utilização do browser normal comumente disponível, 
o Statline se disponibiliza imediatamente em diferentes plataformas (Windows, Mac, 
UNIX). Tercdro, o usuário não precisa aprender uma intei&ce nova uma vez que se 
conheça o browser da rede. Finalmente podemos usar a Internet como um meio de 
comunicação com todas as suas vantagens: largura de banda elevada (28,8 Kbps por 
modem ou mais ainda no caso de links ISDN ou Tl) e grande acessibilidade (conforme dito 
antes na Holanda a Litemet estará a uma chamada telefônica q)enas de distância do mimdo 
intdro ao final de 1995). 

Com milhõ es de usuários potendais tendo possibilidade de acessar os nossos bancos de 
dados estatísticos an Um através da Internet surgem novos desafios. A maior preocupação 
pelo que nós percebemos reside na coordenação estatística das informações que 
disponibilizamos. 

5. COORDENAÇÃO ESTAIÍSIICA 

A maioiia dos bureaus estatísticos disponibiliza centenas de pubhcações estatísticas 
diferentes advindas de muitas centenas de pesquisas. Tudo isto rqpresenta milhões de 
quantitativos, milhar es de tabulações e muitas e muitas fontes diferentes de informações. 
Porém, exceto no caso de algumas publicações espedais (como as contas nadonais), cada 
publicação apenas lida com tópicos muito específicos e os usuários estarão diante de uma 
mina de ouro de informações inaccessívds, com muitas e muitas fôcetas diferentes. Alguém 
que estiver interessado por exemplo em automóvds, predsará estudar mais de uma dúzia 
de publicações para obter um quadro global incluindo a produção de automóveis, 
exportações e importações, quilometragem, consumo de energia, addentes de trânsito, 
efeitos ambientais, etc. Descobrir todas essas informações pode ser especíalmente 
trabalhoso, visto que cada departamento estatístico normalmente se concentra apenas em 
seus tópicos e publicações. Ao mesmo tempo os NSls vendem apenas uma quantidade 
muito limitada de cópias de cada publicação individual com fi-eqüênda sem a recuperação 
de todos os custos de disseminação, muito menos dos custos de coleta de dados. £, 
finalmente, embora os usuários apredem nossa impardalidade e predsão, eles reclamam 
da Mta de oportunidade das informações estatísticas. 




Se todas as infonnações estatísticas di^oniveis forem colocadas na Internet de graça, 
milhões de usuários poderão acessá-las. Compare-se isso com centeias de usuários que 
lêem as nossas publicações impressas. Contudo, não são apenas as implicações em termos 
de distribuição que são surpreendentes, mas também as in^licações conceituais que serão 
grandes e provavelmente mtiito problemáticas. Porque? Por que com tal acesso ilimitado 
a todas as informações estatísticas os usuários solidtarão caminhos de acesso muito 
melhores (busca por palavra chave, consultas multidimensionais, an time, localização, 
região, etc.). Depois que tivermos propordonado todos esses instrumentos eles VCTificarão 
que as nossas infonnações nem sempre são coordenadas e muito menos int^adas. As 
inconsistêndas aterradas em c^enas de diferoites publicações em papel, ficarão visíveis 
na rede e os usuários vão começar a ãzer perguntas, pedir não apenas mais como 
também informações mais coordoiadas e melhor estruturadas. 

Uma resposta a essa demanda por dados mdhores e mais coordenados é a abordagem 
dstêmica como as contas nadonais. Outra meta, menos ambidosa, é a coordenação das 
clasdficações, dommios e definições utilizadas cti diferentes publicações estatísticas. Esta é 
a filosofia subjacente a uma nova abordagem de bancos de dados, baseada no conceito de 
tabdas muhidimaisionais ou 

Como no caso dos dstemas de entrevista asdstida por conq)utador, podemos &zer uma 
distinção entre o dado propriamente dho e sua descri^, o asdm chamado meta dado. 
Enquanto que o dstema CAI se concentra nos dados e metadados individuais processados 
durante os estágios de col^ e edição de dados, no banco de dados de dissoninação nós 
nos concentramos nos dados agr^ados e sois metadados. Esses metadados compreoadem 
tanto a antaxe (formato) quanto a srarântíca do dado (as definições das variáveis 
publicadas, como a definido do núm^o de emproados), como destxição da própria 
pesquisa, as fontes e como os itens são derivados. O primdro passo para coordenar as 
pubUcações estatísticas é padronizar as definições das variávds usadas. 

Cada hCTi (por exmplo, número de enqir^ados) é com fieqüênda disponibilizado para 
diferentes domínios, definidos por cruzamentos de variávds discretas e cat^óricas, como 
setor, r^ião ou tempo. Outro mecanismo inq)ortante para coordenar a disseminação de 
dados estatísticos é a padrorúzação dessas variávds cat^óricas, levando a clasdficações, 
por exonpio, para ramos de indústrias, commodifies, r^ões, etc. A representação bádca 
das infonnações utilizadas em tal banco de dados portanto, representa uma matriz 
muhidimaidonal (ás vezes chamada de cubículo) onde uma dimensão reflete as diferentes 
variávds (por exemplo, número de emproados, lucro, preço), uma segunda variável 
representa o eixo do t^npo 0>or exemplo, anos e meses) , enquanto que outras dimoisões 
respondem a várias clasdficações (setores, commodifies, r^ões, etc.). Os itens dentro da 
matriz refleta as medições sobre uma detominada variável no domínio definido pelo 
oruzamoito das cat^orias no otrtro dxo (um setor x na r^;^ y no tempo t) . Com 
fi’eqüênda as categorias são dassificadas em diferentes sistemas de detalhamento (por 
exemplo, uma clasfificação de indústrias de n algarismos, com n = 1..9) as quais são com 
fireqüdida (porém nem sempre) hierárquicas em relação uma à outra resultando em níveis 
de clasfifica^o. 

Os metadados (descrições) nesse banco de dados de cubículos podem se referir à matriz 
total, aos eixos e suas variáveis e categorias e também aos hens individuais dentro da 




matriz. Problemas especfficos com metadados surgem qtiando as definições de detenninadas 
categorias (como regiões, setores, ccmmodities) mudam com os domínios, especialm«ite 
ao longo do tCTtpo. Como exemplo, tomemos uma região como uma mimidpalidade. Não 
^enas o número de habitantes de Amsterdã ^ 1980 é diferente do número de 1990, 
como também a definição de Amsterdã em si di^e entre os dois anos (por exemplo, por 
causa de ajustes de divisa)! Problemas semelhantes surgem quando certos itens apenas são 
di^onibilizados para det^minadas cat^orias ou níveis de clasdficação tomando a 
comparação dos diferentes hens em vários domínios às vezes in^ossivel. 

Conforme e^licado adma nos bancos de dados estatísticos o tipo mais importante é o 
objeto multidimenàonal, ou cubículo. O banco de dados estatístico pod^ conter muitos 
cubículos diferentes, os quais pod^ão compartilhar de clasrificações sraielhantes ao longo 
de alguns de s^s dxos. Além desses objetos multithmensionais também tabulações 
ouzadas bidemenãonais simples (planas) conforme d^onstrado na maioria das 
publicações estatísticas tradidonais predsam ser annazoiadas e apresootadas no banco de 
dados, asdm como objetos em tesdo (tmidimenàonais) como press releases. Todas essas 
informações são documentadas (metadados) dentro do banco de dados «n vários nívds 
(desde o objeto até o item individua] ou cdulas) . Uma clasdficação dos objetos do banco 
de dados d^itro dos domínios estatísticos bon conheddos (como por exemplo, a 
estatística econômica soda! e d^ográfica), e as suas dasdficações ( produção, ambiente, 
mercado de trabalho, bem estar, etc.), ãzem com que a nav^açâo através desse imenso 
banco de dados seja mais viável. Um instrumento muito pod^oso para descobrir a 
infonnadU) necessária é um sistema de palavras chave aplicável no banco de dados intdro 
(thesaurus) que p^mite ao usuário rq>idamente alocar o objeto correto. 

£m vários países os bancos de dados estatísticos baseados nesse concdto de cubículos 
esâo atualmOTte sardo utilizados ou em construção. Sistemas bem conheddos incluon 
por exemplo PC~Axis da Statistics Swedor , o ABS-Database do Australian Bureau of 
Statistics e o adma mendonado Statline do SN. O Statline é tanto um sistema SN assim 
como tambón um banco de dados aberto an line disponível para clientes fina do SN. 
Dentro do SN de soá utilizado para adonar a publicação de dü^oites tipos de mídia 
(papel, disquete, video texto, etc.) na medida do possrvd sem intoven^ humana (por 
exemplo, com uma conqrodção intdramente automática do material impresso) . O Statlme 
também é usado para nossas consultas internas, por exemplo, para suporte ao cfiente, e 
para propordonar aos dioites com instantâneos do Statline on bases inddoitais, eventuais 
ou r^ulares (por exemplo no caso de asdxratura autmnática de fitx ou corrdo detrônico em 
hot figures). Também e posdvdmente mais importante poderá ser utilizado como vdculo 
de padronização (e portanto de coordenação) de todas as nossas informações estatísticas 
agitadas incluindo nossos metadados. 

Fora do SN o Statlme propordona uma conexão direta para os nossos grandes dientes 
com relação à riqueza que o Statistics Netherlands propordona em termos de informações. 
Através da combinação do inter&ce WTTCH, utilizando a idda das “páginas de rede 
dinâmicas” nós pomitiremos um &dl acesso ao Statline pela Intonet para mmtos outros 
clientes. 



6. DISSEMINAÇÃO: CONCLUSÕES 




Com o aumento espetacular na utilização da Internet em escala mundial a publicação 
eletrônica rapidamente se toma uma realidade. A Internet e em particular a WWW (World 
Wide Wd)) não apenas propordona uma grande fedlidade de utilização e fedlidade de 
acesso a um imenso universo de informações como também propordona grandes desafios 
aos estatísticos. Deveríamos nós simplesmente colocar todas as nossas publicações 
baseadas «n papel de forma eletrônica num servidor de rede usando o mesmo formato de 
documento que usávamos em impressão? Ou deveríamos ainda &zer disponibilizar as 
nossas informações estatísticas de luna forma mais estruturada? Achamos que a 
tecnologia da assim chamada “página dinâmica” como front end de um banco de dados 
como figuras estatísticas será uma solu^k» melhor do que páginas da rede estáticas otn cujo 
caso apenas há uma replicação da metáfora do p^el . 

Mas em geral, irnia vez que as informações estatísticas estejam disponibilizadas num 
formato estruturado e possível de ser lido por máquina como o Stadine podemos 
apresentá-lo de qualquer forma sinqrlesmente através da utilizado de inter&ces como o 
WITCH. Com esse banco de dados não apoias as páginas da rede podem so goadas 
automaticamente mas tambón mensagens de fine e corròo detrônico, press releases, 
bancos de dados em CD-ROM e mesmo até oupput inqiresso na mandia antiga de uma 
forma completamente automatizada. Evidentemeote não apenas os dados propriamente 
ditos como também os metadados deverão ser lidos por máquina, incluindo a sintaxe 
(formato) e a sonântíca (contoído) dos dados. Uma vez tendo alcançado isto, podemos 
&dlmente ãzer o int^câmbio de informações entre os estatísticos utilizando formatos 
padronizados de «tportação como o OESMES da Eurostat, como nós agora exportamos 
documentos do Microsoft Word para o WordPerfect. Só é necessário uma forma 
documeitada e estruturada para armazenagem das informações estatísticas. 




Mesmo se todas as nossas informações estiverem disponívds on üne com Idtura de 
máquina, e bem documentada com muitos metadados, os usuários vão começar a reclamar 
mais uma vez asâm que começarem a ficar -dsíveis as incontístdidas entre as publicações 
eletrônicas. Dai predsaremos de alguma forma de coordenado e integração estatística 
como nós fizemos no caso das contas nadonais, porém num esquema maior. A tentativa 
de int^rar o maior número possível de publicações num número limitado de cubículos 
pode ser o primdro passo na direção certa. Fazer isso vai exi^ um grande esforço na 




dinamização das definições e clas^cações estatísticas. No final os problemas concdtuais 
poderão superar os problemas técnicos. 

Finalmente há um a^ecto interessante no custo e no preço da Internet. Supondo que as 
informações estatísticas por si repres^itam um b^ público, os estatísticos com fi‘eqõênda 
estão predficando informações estatísticas apenas de acordo com os custos marginais de 
reprodução e distribuição. A distribuição e reprodução da Internet ess^dalmente é grátis. 
Portanto pensar-se-ia o que faz&r uma vez que temos a capacidade de colocarmos todos os 
nossos gjgabytes de informações estatísticas disponíveis na Internet. Ela deveria ser 
gratuita ou não? Esse tópico já resultou em acalorados dd>ates na SN. Portanto, além 
dos probl^nas técnicos e conceituais a Internet também levanta questões estrat^cas. 



7. A RESTRUTURAÇÃO DO PROCESSO PRODUTIVO: COLETA DE 
DADOS 

Na parte ant^or nós descrevemos as opções estrat^cas a seim fdtas com rdação às 
&ses de produção do nosso processo. Essas opções represaitam mais do que ^ct3s o 
desenvolvimento de um novo instium^o. 0as afetarão a estrutura do processo produtivo 
propriamente dito. Devonos estar pr^arados para assumir essas conseqü^das também. 
A forma atual ou antiga de estruturação do processo de produção se dá ao longo de 
linhas das estatísticas individuais. Para cada estatística - o produto final - projeta-se um 
novo questionário, sdedona-se o re^ondente, processam-se os dados, e a publicação é 
inq>ressa. Espedalmente do lado do insumo, tudo isso é muito inefidente. 

Conddoamos primdramente a coleta de dados entre os indivíduos e domicílios . Não 
estamos exagerando ao dizer que um grande passo à frente já foi dado na Statistics 
Netherlands. Introduzimos todos os tipos de entrevista auxiliada por computador (CAI) 
e desenvolvemos o BLAISE para ãzer isso (não é necessário dizer que o BLAISE &z 
mais do que ap&aas desenvolver e apresentar questionários eletrônicos). Os ganhos desses 
desenvolvimentos se doam prindpalm^ite em t^mos de um aumento da produtividade ou 
da efidênda. O número de pessoas necessárias para a codifica^, lançam^ito de dados, 
e verificação caiu drastícamoite. Essa efidênda tambdn se dononstra da fisrma muito 
mais rápida pela qual os resultados produzidos. Ainda asdm há muita coisa a ganhar. 
Em primdro lugar a efidênda do processo se revela. Porém, no caso da esfera estatística 
al giima-s melhorias também são possrvds: novas formas de entrevista: CASI, que é a 
^xtrevista equdada por computador, e não diretamoite uma questão de informática, 
desenhos de amostragem mais efidoites. 

Contudo, muito mais está sendo fdto no campo da coleta de dados ratre empresas. As 
demandas aqui foram mais fortes. A carga de resposta tomou-se um problema. £ um fiitor 
motivador por trás de nossas escolhas estratégicas. Quando nós vemos ao mesmo tempo 
que quase todo lugar a informação, a automação e informática invadiram os sistmas 
contávds dos respondentes envolvidos fica claro que a nossa tarefo num fijturo próximo 
será: a edificação da coleta de informações de empresas através do NSI. O que o CAI 
representa para entrevista domidliar, o EDI rqiresentará para coletas de dados entre 
empresas. Mais à fi'ente nesse trabalho nós aprofimdaremos a questão do EDI jimto às 
empresas. 




Na nova situação estamos &lando sobre um horizonte a ihais de dez anos de distânda 
espedalmente na coleta de dados que será reordenada. Não mais a demanda de informações 
porém oferta, os coi^untos de dados reais disponíveis, determinarão a organização: as 
fontes. Cada fonte será derivada uma vez e completamente para qualquer possível 
utilização dentro do NSI. A coleta da informação será técnica e conceitualmente adotada 
àquela fonte. (Nas partes remanescentes desse trabalho nós daremos algumas indicações 
com relação à natureza dessas fontes) . 

Já tendo coletado os dados poderemos ter que traduzi-los em termos de conceito 
estatisticamente adequados, integrá-los e distribuí-los entre os usuários. Eles podem estar 
dentro do NSI, em sistemas integrativos como as contas nadonais, ou fora do NSI. Isso 
significa que em algum lugar esse dados predsarão ser reunidos para distribuição . Do 
lado dos insumos isto pode ser ilustrado da seguinte forma: 



N:N M:1:N 





Ri^. Rfig 



No lado esquerdo nós vemos a velha dtuação com uma linha de produto separada para 
cada estatística individual. Do lado direito temos a situação ôitura. Aí todas as possivds 
fontes contribuem para um banco de dados central de informações relevante. A partir 
daqude banco de dados as estatísticas reais são {>roduzidas pela combinação das 
informações relevantes. E evidente que para podermos combinar as informações devemos 
ter certeza de que as características dessas informações são tais que fiiça sentido uma 
combinação. Estas características esâo espedficadas na metainformação. 



8 . 



DílERCÂMBIO ELETRÔNICO DE DADOS (EDI) 




Daqui em diante vamos nos concentrar no EDI junto às empresas e instituições. A NSI 
coleta dados para produzir um produto estatístico. O que precisa ser feho é a realização 
de uma tradução dos dados do respondente para os dados da produção. Isto é feito de 
várias formas. O primeiro passo pode ser deixado a cargo do respondente. Se esse é o 
caso ele levará a uma determinada carga de resposta. 

O primeiro passo da tradução envolve duas partes. Em primeiro lugar a tradução conceituai, 
o mapeamento dos concdtos da fonte, os conceitos administrativos, os conceitos a serem 
entregues ao NSI. Essa é a parte mais difícil. Não apenas os registros empresariais diferem 
das informações estatísticas como também diferem muito entre si. A s^unda parte da 
tradução é uma parte técnica. Nós gostaríamos de receber dados de uma forma técnica 
adequada. Especialmente nós e nossos respondentes gostaríamos de evitar lançamento de 
dados. 

O intercâmbio eletrônico de dados será uma das ferramentas estratégicas para atender o 
desafío de reduzir a carga de resposta e melhorar a nossa produtividade. Em todos os 
casos individuais deviemos deddir se devemos usá-la e de que forma. Nós vamos 
descrever várias modalidades de EDI e vamos julgá-los pelo sor efeito sobre a carga de 
resposta. De cada possibilidade vamos indicar a natureza da tradução especialmente quem 
é que vai âze-la. Vamos nos concentrar sobre a tradução concdtual. 

a. O EDI de registros centralizados 

Aqui nós não abordamos o respondente individual. Estamos nesse caso lidando com 
informações centralizadas sobre unidades individuais, coletadas para outras finalidades 
além da finalidade estatística e ainda assim representando um interesse para o estatístico. 
Per se, esta foima de coleta de dados não cria carga de resposta. 

Na Holanda existem vários templos de rei^stros utilizáveis. Eles são os registros contábeis 
das empresas jxmto às Câmaras de Comércio. A fita desses registros alimenta o nosso 
rastro de unidades estatísticas. Dados estatísticos também podem ser derivados de 
fontes fiscais (impostos empresariais, imposto sobre o valor agr^ado) ou fontes do seguro 
sodal. Para várias possibilidades (Câmara do Comérdo, imposto empresarial e imposto 
sobre o valor agr^ado) as posâbilidades estão sendo pesquisadas ou utilizadas. 

b. Escritórios de contabilidade 

Uma posdbilidade correlata é a derivação das informações dos escritórios de contabilidade 
comemdal. Esses escritórios mantêm registros sobre informações financeiras ou então 
informações a respeito de salários de um grande número de empresas individuais. Essa 
possibilidade é também atraente por causa do grande número de respondentes envolvidos 
com apenas um elo de ligação. Além disso esses bureaus de serviço serão capazes de 
proporcionar-nos mais informações do que por exemplo os registros fiscais contêm. A 
desvantagem é que esse bureau de serviços provavelmente cobrará de seu cliente por 
responder às perguntas do NSI. Nem todo cliente estará preparado para pagar. 



c. 



EDI sobre respondentes individuais 




Como as possibilidades descritas acima não estão disponíveis nós predsaremos abordar o 
respondente individual. Ao fezer isso predsamos ter consdênda do feto de que as vezes 
predsaremos discernir dentro de uma unidade estatística, com feeqüênda uma empresa, 
vários conjuntos de rastros administrativos. Nós veremos que predsaremos abordar esses 
subconjuntos separadamente e de uma maneira diferente. Dentro das empreseis comerdais 
nós verbos os registros financeiros, as informações logísticas (comérdo intemadonal, 
ações) e os registros sobre salários e emprego. Espedalmente os registros financeiros e os 
registros sobre informações salariais são rigorosamente separados na situação holandesa 

Aqui clasdficamos por tradução da informado. 

c. 1 A tradução do NSI 

Um dos nossos projetos de EDI - EFLO - fimdona ao longo dessa linha. He lida com os 
dados advindos dos munic^os holandeses. Hes entregam um conjunto de rastros 
diietamente derivados do s^ conjunto completo de rastros. A tradu^ é fdta na 
Statistics Netherlands. As vantagens em termos de carga de respostas são evidentes. Muito 
embora sga necessário um trabalho adidonal pdo NSI, esse trabalho adidonal pode ser 
encarado como sendo um investimento dqroidendo da estabilidade do esquona de 
tradução. E^era-se que essa fonna de EDI leve a um aperfeiçoamento da produrividade 
uma vez que os esquemas de tradução estgam conqrletos. O importante é que nós estamos 
aqui lidando com um núm«^o limitado de respondentes (600). 

C.2 O respondente traduz para um registro padrão 

Nesse caso um registro padrão de informação é definido. A padronização com relação 
conridera tanto os aspectos concetuais quarrto os a^ectos técnicos. A produção do 
registro, a escrita do software, é dèbcado a cargo do respondente. Trabalhar com um 
r^istro padrão nem senq>re é possível. Somente pode ser fdto quando a informação já 
está padronizada entre os re^K>nd«ites até um certo grau. Além disso para que sga 
possível o r^istro padrão o NSI às vezes pode ter que se deslocar na direção de 
concàtos do re^ondente. Nesse caso uma parte maior da tradução total na estatística final 
predsará ser fôta pdo NSI. Espedahnoite quando o r^istro padrão estiver 
disponibilizado no software de r^istro que o respondente normalmoite usa e atnalíTa com 
r^ilaridade, essa modalidade de EDI tem um efdto daramente fevorável sobre a carga 
do respondente. 

Temos aqui dois exemplos. Um ddes é CBS-IRIS, o EDI sobre o (X>mércão dentro da 
Comunidade Econômica Europda. O r^istro padrão desoivolvido aqui é implementado 
em mais de 40 sistemas de software disponibilizados no mercado holandês, depois de 
certificação pela Statistics Netherlands. O projeto EGUSES é o outro exemplo. Ele diz 
respdto a informações salariais. Esse (x>njimto de registros ânpresariais é ahamente 
regulamentado na Holanda. Esse feto posribilitou a definição de inn registro padrão. 

C.3 O respondente traduz, não há rastro padrão 




Uma parte ainda muito grande das informações que buscamos são deixadas de fora. O 
respondente a tem numa forma que conceitualmente e tecnicamente difere daquilo que o 
NSl quer e daqiiilo que outros respondente têm. A última possibilidade é que o NSI 
proporciona o soüware pelo qual o respondente pode montar um esquema de tradução 
tanto para a tradução téoiica quanto para a tradução conceituai. Uma vez montada e 
desde que não ocorram mudanças o esquema pode ser utilizado para produzir dados a 
serem disponibilizados para o NSI. O exemplo nesse caso é o EDI-Pilot 2 dirigido para 
registros financeiros e descritos a seguir. 



9. EDI-PBLOT2 



Nós agora vamos descrever o projeto EDI-Pilot 2 direcionado aos re^stros financeiros de 
empresas individuais como ex^nplo. Ele demonstra os problemas com os quais nos 
defrontamos. &iquanto que descrevemos o Pilot-2 podemos nos referir ao esquema da 
seção ant^or. 

O Pilot-2 está diredonado para contas financeiras individuais. No caso da situação 
holandesa âzem açems parte das contas de uma enq>resa. Especialmente as contas a 
respeito de salários e eitqrr^os são excluídas. Não é uma escolha voluntariamente feita 
pela Statistics Netherlands porém uma opção forçada sobre nós pela forma de organização 
da contabilidade neste pais. Ddxando de fora informações detalhadas sobre salários nós 
combinamos dentro do Pilot 2 todas as questões que são colocadas para as contas 
financeiras. O resultado é o questionário comlánado. 

O conteúdo do questionário combinado é ditado por aquilo que é disponível nas contas 
financeiras. Não importa quão r^ulamentada nossa sociedade possa ser os registros 
financdros podem divergir em grande medida nas organizações internas e nos conceitos 
utilizados. Em primeiro lugar isto significa que nós precisaremos adaptar as nossas 
questões na direção das pos^ilidades do sistema automatizado das empresas. Isto pode 
implicar em mais trabalho estatístico para o NSl e para alcançar o mesmo resultado. Se 
quisermos mais, provavelmente será necessário solicitar informações adidonais que sejam 
prestadas erq>lidtamente pelo respondente, o que significa lançam^o de dados. No 
segundo lugar a diversidade dos respondentes significa que lun sistema exclusivo de 
tradução deverá ser montado para cada respondente. 

As contas financeiras também diferem no seu lay-out técnico. Um grande número de 
sistemas de sofrware de contabilidade está sendo utilizado. Não existe um registro padrão 
de informações a ser selecionado eletronicamente no sofrware e não se espera que seja 
possível a d^nição de uma delas no futuro. Uma meta prindpal do Pilot 2 foi a redução 
da carga dos respondentes, portanto decidiu-se que o total de lançamentos de dados 
deveria ser minimizado. 

Isto significa que, seria necessário alguma engenhosidade para criar o link automático que 
buscávamos. Isto é feito pela utilização dos relatórios ou “print-ouf ’ do sistema de 
software. Ao invés de imprimi-los, eles são enviados para um arquivo, um arquivo de 
impressão, a ser lido pelo tradutor, a parte principal do módulo do software que vai rodar 




no computador dos respondentes que está agora sendo desenvolvido como parte do Pilot 
2. O lay-out dos relatórios e portanto dos arquivos de impressão será relatívamente 
estável. O respondente comunica este lay-out ao tradutor. Ele define colunas e fileiras 
dentro do relatório. Subseqüentemente ele informa ao tradutor como manipular as linhas e 
colunas para transformá-las em informações do relatório e informações estatísticas 
solidtadas pelo questionário combinado. Os re^stros resultantes são enviados para a 
Statistics Netherlands. 



O TRADUTOR 




Percebemos aitão as duas partes do esquema de tradução. A primdra parte define o lay- 
out dos arquivos de impresso para íazer a transformação técnica. A segunda parte define 
a transformação concdtual das informações a serem encontradas no arquivo de impressão 
na direção das informações estatísticas solicitadas no questionário combinado. 

A questão final será quem ârá o esquema de tradução. Um dos prindpios do Pilot 2 é que 
“o respondente tradutf . Isto significa que o próprio respondente predsa definir o esquema 
de tradução. Isto evidentemente o toma menos amistoso para o respondente. Parece 
contudo impossível montar esses esquemas de tradução na Statistics Netherlands . Está 
claro que não será uma tare& âdl para o re^ondente. Por um lado isso dgitifica que um 
help-desk poderoso e um serviço de campo relativamente grande s^o necessários, e por 
outro lado significa que mesmo com o Pilot 2 ainda não chegamos ao máximo em termos 
é&jnendlmess do EDI com relação ao usuário final. 

Esperamos que o esquema de tradução sga relativamente estável, ou, em outras palavras, 
que as mudanças técnicas e conceituais vão sejam muito freqüentes. Da segunda vez o 
tradutor pode já usar o esquema de tradução disponível para produ^ as informações 
estatísticas. Responder o questionário combinado toma-se então uma questão de minutos 
em vez de horas e ele pode ser feito por um fimdonário menos qualificado. Isto é o que 
toma o conceito atraente e fez com que o investimento inidal vale a pena para o 
respondente. 








10. ESCOPO DO PBLOT 2 



Confonne já dito o Pilot 2 está dirigido para contabilidade financeira. O princípio é que 
todas as informações que são derivadas das contas financeiras por qualquer estatística da 
Statistics Netheriands passam pelo Pilot 2 para que seja possível a recuperação automática 
daquela informação. Ka prática isto significa que várias grandes estatísticas mudar 
completamente para o EDI. No caso da indústria que é a nossa meta principal, descobrimos; 

• estatística mensal sobre &turamento total 

• estatística mensal sobre comércio internacional, por produto 

• estatística trimestral sobre faturamento por produto 

• estatística anual sobre investim^to bruto 

• estatística anual sobre processo produtivo 

• estatística anual sobre processos financeiros, incluindo balanços 

A partidipação do comércio intonadonal é um piloto dentro do piloto. Não apenas a 
Statistics Netheriands já tem um EDI bem sucedido nessa área no caso do IRlS, mas 
também as possibilidades de conseguir suficientes informações sobre o comérdo 
internacional quando dirigido em primeiro lugar à contabilidade financeira ainda precisa ser 
pesquisado. 

Algumas questões sobre as estatísticas acima mencionadas ^o deixadas de lado, por 
exCToplo, as questões sobre as quantidades de energia utilizadas na estatística de produção. 
Elas vão podem ser tratadas por essa forma de EDI. Provavelmente um questionário 
separado no papel sobre esse assunto deverá ser enviado. 

Por outro lado, algumas questões advindas de outras estatísticas visando principalmente 
outros assuntos e contas (por exemplo, contas sobre salário e trabalho) estarão incluídas 
porque as respostas que tipicamente serão encontradas estarão dentro das contas financeiras 
daenqrresa. 

O domínio do EDI conriste das empresas comerdais que estabeleceram contas financdras 
através de software de computação que atende a certas especificações técnicas. Na prática 
isso significa que nós nos dirigimos na direção do setor do lucro dentro da indústria, 
comércio e serviços. Começamos com a indústria porque é ali os ganhos em termos de 
redu^ da carga do respondente serão maiores. As empresas m^ores Tão estão induidas 
porque a sua capaáàzàe de automa^ normalmente é muito baixa. £m vista da 
relativamente pequena quantidade de informações aqui solicitadas espera-se mais de 
rastros centralizados Çmposto sobre valor agregado, imposto de renda corporativo) e de 
escritórios de contabilidade que com fi'eqüência fazem a escrita de centenas de empresas 
menores. As empresas muito grandes também são excluídas. Visto da sua complexidade, 
elas precisam de uma abordagem individual que no final das contas representará um EDI 
feito sob encomenda para elas. 

Com relação ao número de respondentes partidpantes desse tipo de EDI, devemos 
mencionar que no Pilot 1 um número de 12 participantes participaram e ainda o fezem. O 
Pilot 2 vai ser inidado com testes de campo em março e estará dirigido a 20 respondentes. 




A partir de setembro de 1996 visamos números maiores. Pelo final de 1996 o Pilot 2 
deverá tratar de várias centenas de respondentes. O Pilot 2 também será utilizado para 
abordar o bureau de contabilidade. Isso levará a números ainda maiores de unidades 
estatísticas descritas com um link de EDI. Se o EDI-Pilot 2 for bem sucedido nós 
imediatamente seguindo o Pilot 2 em 1977, visaremos um número de 25 mil unidades a 
serem abordadas com esse instrumento, parcialmente através do bureau de contabilidade 

A receita do Pilot 2, se bem sucedido, em primeiro lugar será um alívio da carga dos 
respondentes. Os ganhos de produtividade não serão assim tão grande. Em primeiro lugar 
todos os tipos de atividades permanecem. Nem todo respondente deverá participar, os 
dados ainda precisarão ser verificados, etc. Em segundo lugar novas utilidades surgem na 
forma de um help-desk cada vez maior e um serviço de campo que não apenas predsaiá 
enfirentar problemas de contabilidade como também problemas de automação técnica. 

Um projeto semelhante tal como o EDI Pilot 2 holandês é o projeto TF.T.F.R No TELER 
vários NSIs europois trabalham em coigunto (sobre supervisão holandesa) para testar o 
concdto do EDI na coleta de dados estatísticos. O projeto TELER que vai fimdonar de 
1966 até 1998, é pardalmente fihandado pela Comunidade Econômica Européia. 



11. O CONTROLE DO PILOT 2: O META SISTEMA 



Eventualmente a Statistics Netherlands visa alcançar vázios milhar es de respondentes 
utilizando o H)L Isto evidentemente exige um dstema de controle para enfi’entar a 
produção de um questionário detrônico apropriado, enviando-o ao respondente, 
verificando a resposta, verificando e armazenando os dados que entram, e controlando um 
possível feed back. Isto significa que muitas informações, meta informações, sobre os 
respondente predsam ser atualizadas. 

Uma outra parte da metainformação diz respdto ao conteúdo do questionário combinado. 
Como exemplo nós vamos nos concentrar naquela parte. A construção do questionário 
combinado exige que nós coordraemos a abordagem de diferete estatísticas, (ürigjdas aos 
registros financdros entre d, mas também com os procedimentos contábds dos 
respondente. Evidentemente ese últimos já aconteceram ante, porém, no caso do EDI 
será mais eq)iídto. Isso alguma negodação. Ficou claro que com o EDI 

fimdonando, grande parte da autonomia da estatística individual espedahnente com relação 
ao questionário, desaparece. 

O módulo que contem o tradutor nos dá melhore oportunidade para suprir as meta 
informaçõe ao respondente do que ante. Existem e fimçõe on Une de ^uda. Através do 
hipe texto as explicaçõe são ligadas entre d. Para o f^lp-desk e para o seviço de campo, 
provavelmente será montado um dstetna mais detalhado de fimçõe de ajuda e de 
explicaçõe. O dstema contém lúLo apene ligaçõe cruzadas como também regras 
computadonais de tal mandra que os totais possam ser computados imediatamente. 

Para essa finali dade^ um conjunto de variáveis foi montado num banco de dados, com 
nome, textos, explicaçõe, e, se necessário, relaçõe computadonais com outras 




variáveis. A partir desse banco de dados, variávãs, questões, explicações, etc., são 
seiedonadas e combinadas aos questionários. Os respondentes são classiticados em grupos 
por tamanho, ramo de atividade e tipos de registros financdros mantidos. Às veses os 
registros de vendas são mantidos pela empresa, porém os balanços anuais são escriturados 
por um escritório de contabilidade. Para aquela unidade estatística o total das informações 
necessárias precisará ser coletado por dois questionários diferentes dirigidos para duas 
unidades de relatórios diferentes. Cada conjimto tem seu próprio relatório combinado. 



12 . EDI: CONCLUSÕES 



Desta forma um grande coqunto de meta informações sobre os conceitos passa a surgir. 
Essas meta informações controlam o processo de coleta de dados. Uma ques^ 
diredonada aos registros financeiros som^e chiará lá através de bancos de dados de 
vaiiávds centrais. Ao lançar a variável a relação com o resto do contoído precisará ser 
esdaredda. 

Bm primdro higar agora vemos que o caráter da metainformação mudou. Na maior parte da 
literatura nós verificamos com fi'eqüâida que a metainformação é apenas uma informação 
descritiva disponibilizada apenas se o estatístico encontrou tempo sufídente para montá- 
la, piindpalmente depois que de produziu a sua estatística para o benefido do usuário. 
Se mais tarde o estatístico divergir de sua metainformação anterior, não há nada que o 
impeça e nada que garanta que a metainformação sga adaptada. 

Aqui nós encontramos uma metainformação que predsa ser montada antes que comece o 
processo de produção. O estatístico não pode evitar a utilização do sistenia de 
metaiofoimação. A metainformação tomou-se um insCrunento do processo produtivo. Ao 
invés de ser descritiva ela chegou a ser presaitiva. Anteriormente nós vimos a mesma coisa 
acontecendo com a disseminação e coleta de dados domiciliares através do BLAISE. 

Isto contudo tem conseqüências ainda mais abrangentes. Nós pod«nos agora retomar às 
primeiras partes desse trabalho. Lá nós folamos a respeito das demandas adidonais a serem 
colocadas sobre os NSIs. Uma ddas seria a redução da carga do respondente. Esta foi a 
prímdrã meta do EDI - Fflot 2. Porém nós também percebemos como que o ímpeto 
teoiológico nos dá algumas oportunidades de at^der a uma outra demanda, ou sga, a 
demanda por um coerênda maior. Sem dúvida nenhuma a forma pela qual o EDI será 
implementado vai levar a uma coordenação ainda maior dos dados estatísticos e 
conceituais. Mendonamos o poder do meta ristema e perceb^os também dentro do EDI 
que várias estatísticas estão conâiinadas para produzir processo anteriormente 
independentes e separados. £ notável o foto de que esse cresdm^o na coordenação 
estatística não é alcançado através de um aumento das diretrizes entrais mas como um 
subproduto dos instrumentos utilizados no processo de produção. Nós não achamos que 
todos os problemas de coerênda do nosso produto final que significa que todos os 
problemas da coordoiação estatística, possam ser resolvidos através da aplicação do 




instrumento adequado. Nós achamos contudo que um maior aperfeiçoamento deve ser feito 
nesse campo apUcando-se as possibilidades do ímpeto tecnológico da forma correta. 




